package com.news.service;

import com.news.model.ArticleContent;
import com.news.model.NewsItem;

/**
 * 网页内容提取服务接口
 */
public interface ContentExtractorService {
    
    /**
     * 从URL提取完整的文章内容
     * @param url 文章URL
     * @return 提取的文章内容，包含文字和图片
     */
    ArticleContent extractContent(String url);
    
    /**
     * 从新闻项提取内容
     * @param newsItem 新闻项
     * @return 提取的文章内容
     */
    ArticleContent extractContent(NewsItem newsItem);
    
    /**
     * 检查是否支持内容提取
     * @param url 要检查的URL
     * @return 是否支持
     */
    boolean isSupported(String url);
    
    /**
     * 清理内容缓存
     */
    void clearCache();
} 